FileBlogは、Windowsファイルシステム(NTFS)のフォルダを監視しているので、新しく追加・変更されたファイルもすぐに検索が可能になります。
しかし、ネットワークの状況や、オペレーションのタイミングによっては、まれに取りこぼしが発生する場合もあります。
この問題に対応するために、全てのフォルダを順にスキャンして、取りこぼしたファイルをインデックス登録し、ファイルシステムから無くなったファイルをインデックスから掃除する処理を行います。
ここではスキャンを行うプログラムを、Windowsタスクスケジューラに登録して定期的に実行させる設定について説明します。
登録する定期実行タスク
• | クロール処理 (tpidxcmd crawlall ) |
ドキュメントルートフォルダをスキャンして、新たに追加されたファイルで、検索インデックスに未登録のファイルがあれば登録します。
クロール処理が遅れると、検索漏れが発生しますので、毎日あるいは毎週実行してください。
• | パージ処理 (tpidxcmd purgeall ) |
検索エンジンに登録されたファイル一覧をスキャンして、ファイルサーバ上からすでに削除された文書があれば、登録を解除します。
パージ処理が遅れても検索漏れにはなりませんが、検索性能がじわじわと低下しますので、1ヶ月~2ヶ月に1度は実行してください。
設定方法
Windows Server 2003, Windows XP の場合
1. | [スタート]→[コントロールパネル]→[タスク]→[スケジュールされたタスクの追加]を実行します。 |
2. | タスクウィザードが起動します。「次へ」をクリックしてウィザードを開始します。 |
3. | プログラムの選択画面で、「参照」ボタンをクリックして、以下のプログラムを選択して、次に進んでください。 |
[InstallDir]\Bin\tpidxcmd.exe
例) c:\Program Files\Teppi Technology\fileblog\3.0\Bin\tpidxcmd.exe
4. | 実行の周期(スケジュール)を選択してください。なお1回のスキャンにかかる時間が、タスクの周期よりも大きいと無限にスキャンし続けてしまうので、以下の目安を参考に周期を選択してください。 |
• | 5万ファイル程度まで:1日に1度(スキャンにかかる時間:5時間程度) |
• | 10万ファイル程度まで:2日に1度(スキャンにかかる時間:10時間程度) |
• | 50万ファイル程度まで:1週間に1度(スキャンにかかる時間:2日程度) |
6. | 実行ユーザーを入力します。このユーザーにはtpidxcmd.exeを実行する権限が必要です。 |
7. | 「詳細プロパティ」を開くにチェックを入れて、完了ボタンを押します。 |
9. | 実行するファイル名に "crawlall" という引数を追加してください。 |
変更前
"C:\Program Files\Teppi Technology\fileblog\3.0\Bin\tpidxcmd.exe"
変更後
"C:\Program Files\Teppi Technology\fileblog\3.0\Bin\tpidxcmd.exe" crawlall
11. | 同様に以下のスケジュールを追加してください。 |
"C:\Program Files\Teppi Technology\fileblog\3.0\Bin\tpidxcmd.exe" purgeall
12. | 以上で設定は完了です。続いて、正常に動作するか確認を行います。 |
13. | [スタート]→[コントロールパネル]→[タスク] でタスクの一覧を表示します。 |
14. | "tpidxcmd" という名称でタスクが作成されているはずです。このタスクを選択して、右クリックし「タスクの実行」メニューをクリックします。 |
※このタイミングで、全ての DocumentRootの全てのサブフォルダをスキャンします。
15. | ブラウザからFileBlogにアクセスし[システム設定]→[インデックス構築状況]にアクセスしステータスを確認します。 |
16. | ステータスが「フォルダスキャン」になっていれば、スキャンが開始されています。 |
※フォルダ数、ファイル数が少ない場合は、既に処理が完了しており、ステータスが「フォルダスキャン」以降になっている場合もあります。
Windows Server 2008 / 2012, Windows Vista / 7 の場合
1. | [スタート]→[コントロールパネル]→[管理ツール]→[タスクスケジューラ] を実行します。 |
2. | 「タスク スケジューラ ライブラリ」の「基本タスクの作成」を開きます。 |
3. | 「名前」と「説明」の欄にわかりやすい文言を入力して次に進んでください。 |
4. | 実行の周期(スケジュール)を選択してください。 |
※1回のスキャンにかかる時間が、タスクの周期よりも大きいと、無限にスキャンし続けてしまうので、以下の目安を参考に、周期を選択してください。
• | 5万ファイル程度まで:1日に1度(スキャンにかかる時間:5時間程度) |
• | 10万ファイル程度まで:2日に1度(スキャンにかかる時間:10時間程度) |
• | 50万ファイル程度まで:1週間に1度(スキャンにかかる時間:2日程度) |
6. | 「操作」の項目は「プログラムの開始」を選択して次へ。 |
7. | プログラム/スクリプトの項目で「参照」から下記プログラムを選択 |
[InstallDir]\Bin\tpidxcmd.exe
例) c:\Program Files\Teppi Technology\fileblog\3.0\Bin\tpidxcmd.exe
8. | 引数の追加項目に"crawlall" を入力して次へ。 |
9. | [完了]をクリックしたときに、このタスクの[プロパティ]ダイアログを開くにチェックを入れて完了をクリックします。 |
10. | プロパティダイアログが開きます。「セキュリティオプション」項目の「ユーザーがログオンしているかどうかにかかわらず実行する」にチェックを入れてOKをクリックします。 |
11. | 同様に以下のスケジュールを追加してください。 |
"C:\Program Files\Teppi Technology\fileblog\3.0\Bin\tpidxcmd.exe" purgeall
12. | 以上で設定は完了です。続いて、正常に動作するか確認を行います。 |
13. | [スタート]→[コントロールパネル]→[管理ツール]→[タスクスケジューラ]でタスクスケジューラライブラリを表示します。 |
14. | 手順「3」で入力した名称でタスクが作成されているはずです。このタスクを選択して、右クリックし「実行する」をクリックします。 |
※このタイミングで、全てのDocumentRootの全てのサブフォルダをスキャンします。
15. | ブラウザからFileBlogにアクセスし[システム設定]→[インデックス構築状況]にアクセスしステータスを確認します。 |
16. | ステータスが「フォルダスキャン」になっていれば、スキャンが開始されています。 |
※フォルダ数、ファイル数が少ない場合は、既に処理が完了しており、ステータスが「フォルダスキャン」以降になっている場合もあります。
|